16/08, 2023

Que es la investigación reproducible?

  • Código, datos (Crudos) y texto entrelazados
  • en R: Rmarkdown (Rmd)

Github

Github

  • Como “Google Drive” o “Dropbox” para código
  • Control de cambios (Podemos volver a cualquier versión anterior)
  • En base a codigo (idealmente), pero hay GUIs
  • Cada proyecto es un repositorio

Crear primer repositorio

  • Crearse cuenta en github.com
  • Crear repositorio en github

Crear primer repositorio

Copiar la url

Volvamos a RStudio

  • Creamos un proyecto nuevo

Pegamos la URL

La nueva pestaña git

Los “¿tres?” pasos de un repositorio

  • Git add: Agregar a los archivos que vas a guardar
  • Git commit: Guardar en el repositorio local (Mi computador)
  • Git push: Guardar en el repositorio remoto (En la nube)
  • Otros como git merge, git pull, git clone, etc

Git Add

  • Sumar un archivo al repositorio
  • ¿Cuando no hacerlo?
    • Limite de un archivo de 100 Mb
    • Límite de un repositorio de un Gb

Git commit

  • Con esto dices quiero guardar mis cambios en mi disco duro
  • Se guarda en tu repositorio local (Tu computador)

Mensaje del commit

  • Debe ser relevante (ejemplo, no poner Version final ahora si)
  • Si te equivocas puedes restablecer a cualquier commit anterior (si sabes cual es)

A guardar el repositorio (git push)

  • Con esto subes tu commit a la nube (queda respaldado)

Clásico error

Configurar github

git config --global user.name "derek-corcoran-barrios"
git config --global user.email "derek-corcoran-barrios@gmail.com"

Si no resulta

  • Si estas en windows instala git
  • Si estas en mac
  • Si estas en linux
sudo apt-get update
sudo apt-get install git

Dudas?

Reproducibilidad en R

  1. Una carpeta
    • Datos crudos (csv, xls, html, json)
    • Codigo y texto (Rmd, Rpres, shiny)
    • Resultados (Manuscrito, Pagina Web, App)

Antes de empezar (importar datos)

  • Hasta ahora hemos usado data (sólo para bases incorporadas en R)
  • Desde hoy usaremos read_csv (Para csv, para otros archivos hay otras funciones)
  • Otro tipo de datos son los .rds, todo puede ser transformado a este formato

Datos para trabajar

  • Puedes hacer:
library(readr)
plants <- read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2020/2020-08-18/plants.csv')

o

plants <- readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2020/2020-08-18/plants.csv')

Crear un nuevo Rmarkdown

Esta vez usaremos un template de un github document

Partes de un Rmd

  1. Texto
  2. Chunks
  3. Inline code
  4. Cheat sheet Rmd (torpedo)
  5. El botón mágico Knit

Texto (sintáxis de markdown)

link

# Titulo

## subtitulo

*cursiva*

**negrita**

[link](https://stackoverflow.com/users/3808018/derek-corcoran)

Chunks

Ejemplo 1

Elijamos solo plantas de Chile

  • En nuestro Rmd hagamos un data.frame solo con plantas de chile
  • Elijamos solo las columnas de especie

Ejemplo 2

  • En nuestro Rmd hagamos un data.frame resumen, de número de plantas extintas por país de America del Sur
  • Ahora subamoslo a github